“你有多确定?” — 这是分析数据时的一个基本问题,可以使用置信区间来回答这个问题。
关键概念:平均值置信区间
平均值的置信区间是多少?
平均值的置信区间(CI)可以告诉你确定平均值的精确程度。
例如,你对小样本(N = 5)的重量进行测量,然后计算平均值。该平均值不太可能等于群体平均值。可能差异的程度取决于样本量和样本变异性。
如果你的样本很小且可变,则样本平均值很可能与群体平均值相差甚远。如果你的样本很大且几乎不分散,则样本平均值可能与群体平均值非常接近。统计计算可以结合样本量与变异性(标准偏差)来生成群体平均值的置信区间。顾名思义,置信区间是一系列值。
在解释平均值的置信区间时做了哪些假设?
如需解读平均值的置信区间,必须假设所有值均从群体中独立、随机抽样得到,且该群体值的分布服从高斯分布。如果你接受这些假设,则95%置信区间有95%的几率包含真实的群体平均值。也就是说,如果基于许多样本生成许多95%置信区间,你可以在预期95%置信区间在95%的情况下包含真实的群体平均值,而在其他5%的情况下不包含群体平均值。
平均值的置信区间一定会包括真实平均值
下图中的靠上示图中显示了10组数据(N = 5),随机抽样取自高斯分布,平均值为100,标准偏差为35。下部视图中显示了每个样本平均值的95%置信区间。
由于这些数据均为模拟数据,我们知道真实群体平均值(100)的确切值,因此可以询问每个置信区间是否包括真实群体平均值。在上图中从右数第二个数据集中,95%置信区间不包括100的真实平均值(虚线)。
在分析数据时,你不知道群体平均值,因此不能知道某个特定置信区间是否包含真实的群体平均值。你所知道的是,置信区间有95%的几率包括群体平均值,有5%的几率不包括群体平均值。
平均值的置信区间的计算方式?
平均值的置信区间以样本平均值为中心,并在两个方向上对称延伸。该距离等于平均时间SE乘以t分布的常数。该常数的值仅取决于样本量(N),如下所示,
上图中显示的样本有五个值。因此,其中一个样本的置信下限计算为平均值减去2.776乘以SEM,置信上限计算为平均值加上2.776乘以SEM。上表的最后一行示出了用于在Excel中计算乘数的公式。较新的语法 = T.INV.2T(0.005,N - 1)。
一种常见的经验法则是,95%置信区间从加上或减去两个SEM的平均值计算得到。
对于大样本,该法则非常准确。对于小样本,与按经验法则得出的置信区间相比,平均值的置信区间要宽得多。
置信区间无法量化可变性
95%置信区间是一个数值范围,你可以95%确定包含群体的真实平均值。这与包含95%数值的范围不同。以下图表突出了这一区别。
该图表显示了三个样本(大小不同),都是从同一群体中抽样。
左侧是小样本,95%置信区间与数据范围相似。但是右侧的大样本中只有一小部分值在置信区间范围内。这很有道理。95%置信区间定义了一个值范围,你可以95%确定包含群体平均值。大样本的平均值比小样本的平均值具有更高的精度,因此从大样本计算出的置信区间非常窄。
注意!请勿将置信区间误解为包含95%值的范围
95%的几率是什么?
准确来说,计算置信区间有95%的几率具有真实的群体平均值。群体平均值有95%的几率在区间范围内的这一说法并不太准确。
有什么不同?
群体平均值只有一个值。但你并不知道该值是什么(除非在做模拟),但它只有一个值。即使重复进行实验,该值也不会改变。从严格意义上来说,询问群体平均值在某个范围内的概率不一定是正确的。
相比之下,计算的置信区间取决于偶然收集的数据。如果重复进行实验,则得出的置信区间几乎肯定不同。因此,可以询问区间包含群体平均值的概率。
关于群体平均值在区间内的概率这个问题其实没有意义。概率要么在区间范围内,要么不在。并不存在几率的问题。可以这样说,假如多次进行此类实验,置信区间不一定都一样,你会期望95%的置信区间包含群体平均值,5%的置信区间不包含群体平均值,你无法得知某个特定实验的区间是否包含群体平均值。
95%并无特别之处
虽然置信区间通常用95%的置信度来表示,但这只是一个惯例。可以针对任何想要的置信度计算置信区间。
第二部分
01
其他置信区间
置信区间的概念是通用概念。在分析数据时,可为我们所计算的几乎所有值计算95%CI。前面的文章中,我们已讨论过平均值的标准偏差和标准误差:
两组平均值之间的差异 比例 两种比例的比率 线性回归的最佳拟合斜率 通过非线性回归确定的EC50的最佳拟合值 两组中位生存时间的比率 一组值的中值
统计学的基本概念是分析数据样本,并对总体(从中抽取数据)进行定量推断。置信区间是完成这项操作最简单的方式。
02
单侧置信区间
通常,置信区间表示为双侧范围。例如,你可以使用95%置信度来说明一项参数的真实值(平均值、EC50、相对风险、差值等)位于两个数值的范围内。GraphPad将该区间称为“双侧”,因为该区间同时受置信下限和上限的限制。
在某些情况下,只在一个方向上表达置信区间更有意义 - 置信下限或上限。这最好通过以下一个示例予以说明。
已经开展一项近期研究,以评价一种新药根除幽门螺杆菌感染的有效性,并确定其是否低于标准药物。(该示例改编自参考文献1*的示例)。新药的根除率为86.5%(109/126),而接受标准治疗的患者为85.3%(110/129)。
在本研究中,两种治疗的根除率差值为1.2%。关于新药,95%置信区间从比标准药物差7.3%的根除率下限延伸到比标准药物优9.7%的根除率上限。
如果我们假设本研究的受试者代表更大群体,则意味着该数值范围有95%的概率会包括两种药物根除率的真正差值。将剩余的5%分开,新治疗将根除率提高9.7%以上的概率为2.5%,新治疗将根除率降低7.3%以上的概率为2.5%。
在此情况下,我们的目标是证明新药并不比旧药差。因此,我们可以将95%置信度与2.5%上限相结合,并假设新药的根除率比标准药物的根除率差7.3%以下的概率为97.5%。
然而,传统的说法是置信区间为95%,而非97.5%。我们可以很简单地设立一个单侧95%置信区间。为此,我们只需计算90%(而非95%)双侧置信区间。
根除率差值的90% CI从 - 5.9%延伸到8.4%。由于我们不太确定其是否包含真实数值,因此不会像95%区间一样延伸。我们可以重申95%置信区间大于 - 5.9%。因此,我们有95%的信心认为新药的根除率并不比标准药物差5.9%。
在检验非劣性的该示例中,只将单侧置信区间表示为下限才有意义。在其他情况下,将单侧置信限仅作为上限才有意义。例如在毒理学中,您可能只关注置信上限。
GraphPad Prism不直接计算单侧置信区间。但是,如该示例所示,由你自己创建单侧区间非常简单。只需让Prism为您关注的数值创建一个90%置信区间。如果你只关注下限,则假设你95%确定真实数值高于(90%)下限。如果你只关注上限,则假设你95%确定真实数值低于(90%)上限。
参考文献:*1. S. J. Pocock,“非劣效性试验的利弊”,《基础与临床药理学》,17:483-490(2003)。
03
建议
许多统计分析会生成P值与置信区间。许多科学家报告了P值,却忽略了置信区间。
GraphPad认为这是错误的。
关于P值的解读通常比较棘手,相比之下,解读置信区间相当简单。你收集一些数据,做一些计算来量化差异(或比率,或最适合的值...),并报告该值以及置信区间,以显示该值的精确程度。
第三部分
置信区间
预测区间
容许区间
单样本SD与群体SD不同
置信区间不仅仅用于计算平均值
SD的95% CI
免费的GraphPad在线计算器 链接↓:
https://www.graphpad.com/quickcalcs/CISD1.cfm
*复制粘贴上面的链接用浏览器打开即可
示例
使用Excel计算SD的CI
相关推荐:
「视频教程」GraphPad Prism 8 软件操作教程 中文字幕
「视频教程」手把手教你用GraphPad Prism做符合SCI投稿的标准图
GraphPad Prism 7 for Win / Mac 完美破解版 统计绘图软件 附安装教程
GraphPad Prism 8.4.3 for Win/Mac 最新完美激活中英文版医学绘图软件+安装教程
GraphPad Prism 9 for Win/Mac 完美学习版+安装教程